点击领取语言文字检索数据库大礼包!
点击蓝字 关注学界动态
语言文字检索数据库推介·第1辑
编者按:为了方便广大语言文字爱好者及研究者了解与研究语言文字,小编收集了十个便于检索使用的语言文字数据库网站,以期对读者研究语言文字提供一定的帮助。网络资源良莠不齐,还望广大学友注意甄别取舍,也欢迎各位读者留言推荐方便实用的语言文字数据库。本期推文为“语言文字检索数据库推介”系列推文第1辑。
1.国学大师
古典图书集成《国学大师》集成古典图书2万种28万卷约24亿字,基本上囊括了中国常见的古代图书,是目前网上收录古典文学作品最全最多的图书集成之一。《国学大师》功能齐全,支持手机检索,可以满足大多同学日常检索文字的需求,如若遇到异体字、疑难字等不易查找的字,还可通过部件查字等方式检索。
网站地址:http://www.guoxuedashi.net
2.引得市
引得市“语文辞典”数据库收录了280种文献,近百万笔资料。这些文献以上迄殷商、下至当代的出土、传世文献的字编和辞典为主,并可通过与“部件检索”“缺字数据库”相串连,来支持其中计算机缺字的显示以及部件的搜寻检索。“出土文献”数据库则提供了出土文献著录、释文等信息,包括“甲骨文”“金文”“简牍帛书”“玺印封泥”“砖瓦陶文”“碑碣石刻”等多种类别的出土文献。
网站地址:
https://www.mebag.com/index/
使用说明:
https://zhuanlan.zhihu.com/p/355856032
3.数字化《说文解字》
数字化《说文解字》是由北京师范大学教授王宁先生主持研发的国家社科基金重大项目“数字化《说文》学及其研究平台构建”的标志性成果,共包括六大区域:字头检索、全文检索、反例索引、构形系联、古音系联和帮助。
“字头检索”:包括读音、字形、说解与书签四部分。
“全文检索”:该模块支持大徐本《说文解字》、小徐本《说文解字》、段玉裁《说文解字注》和《章太炎<说文解字>授课笔记》文本的全文检索。
“凡例索引”:将大徐本《说文解字》中的凡例,亦即说解某些特殊内容时固定的程式用于以树状图的形式分门别类地列举出来。第一层级的凡例包括“上讳”“阙”“部首”“形体”“析形”“直音”“一曰”“旁见说解”“引经”和“引通人说”等内容,每一大类下又分若干小类。
“构形系联”:模块包括两大部分:一是单个小篆的构形分析,二是拥有相同构件的小篆的构形系联。
“古音系联”:“数字化《说文》学研究平台”为《说文》中的小篆提供了两套上古音标注体系。一套是黄侃先生的“十九纽二十八部”,另一套是王力先生的“三十三母三十部”。
网站地址:http://szsw.bnu.edu.cn
4.瀚堂典藏数据库系统
《瀚堂典藏》是一个采用国际通用的超大字符集进行加工校勘的古籍数据库,其最大特色是文本精准无缺字,并采用高速检索技术整合各个分库。网站左上角的“目录树”中一万多个节点可以自由勾选组合,灵活跨库。点击节点内容并可以查看单一书目简介。图书节点为绿色,表示该书全部内容可以图文对照全文浏览。在未做任何勾选的情况下,单字检索仅查询《康熙字典》修订版中的内容,多字检索查询“小学工具-文字”分库下面的内容。
网站地址:https://www.hytung.cn
5.先秦甲骨文金文简牍词汇资料库
该数据库分为“词汇检索”及“全文检索”两种搜寻接口,可依用户的需求进行选择。
“词汇检索”的内容是经搜集、整理、考释的词汇数据,搜寻方式包括三部分:“词汇查询”、“词类查询”以及“材质/书籍查询”。可自行输入词汇进行检索,也可透过限定符类或出土材料范围,找出符合条件的词汇。查询后会显示条列式数据,提供严式、宽式、词类、时代、材质、书籍、编号、释文等讯息,并且可依词类、时代、材质/书籍/编号三种方式进行排序。
“全文检索”包括两个部分:“释文查询”和“材质/书籍查询”。可以在“释文查询”字段键入不含标点的任何字词,再选择所需要的出土材料,便可得到详细的相关资料。
网站地址:
https://inscription.asdc.sinica.edu.tw
6.殷契文渊
“殷契文渊”是由安阳师范学院甲骨文信息处理教育部重点实验室和中国社会科学院甲骨学殷商史研究中心合作建设的非营利性网站,是专门性质的甲骨文资源大数据平台及数据检索分析技术支撑的一体化网站,包括“三库一平台”即甲骨字形库、甲骨著录库、甲骨文献库、甲骨文知识服务平台。
网站地址:http://jgw.aynu.edu.cn
7.异体字字典
该字典收录十万余字(含正字、异体字、附录字),收字系以标准字体为纲领,陈列文献中所见之相应异体字,为总整汉字字形的大型数据库。
网站地址:https://dict.variants.moe.edu.tw
8.古音小镜
古音小镜是一个历史语言学材料和工具的共享站,主要用于探索汉语的早期历史,主要领域为上古音,兼及古文字、民族语、音韵训诂、汉语地理等内容。
网站地址:http://www.kaom.net/index.php
9. 小学堂
小学堂文字学数据库是一个形、音、义综合的文字学数据库,可提供用户根据文字的形、音等属性先检索出字头,再透过字头连接到个别的形、音、义数据库或字书索引。数据库收录的字形涵盖甲骨文、金文、战国文字、小篆及楷书,总数超过22万字;收录的声韵资料涵盖上古、中古、近代及现代,总数超过134万笔;收录的字书索引数据则超过36万笔。
数据库主要由汉字古今字数据库及汉字古今音数据库组成。汉字古今字数据库由甲骨文、金文、战国文字、小篆数据库组成,而汉字古今音数据库则由上古音、中古音、近代音、现代音数据库组成,各数据库除可互相链接外,也可独立使用。
网站地址:https://xiaoxue.iis.sinica.edu.tw
10.古今文字集成
古今文字集成是一个集古今文字释义、字形更革、音韵演变之大全的大型在线辞书。所谓古今文字之古文指的是简体字出现(1935年8月)之前使用的汉字,而今文指的是现代的简化字(非简体字)。由于简体字、简化字、繁体字(正体字)的关系错综复杂,该网站收录Unicode规定的所有东亚汉字(收录至CJKExtentionF)在现代字典中的解释、古代字书(如《康熙字典》《说文解字》)中的解释、字形更革、音韵演变、方言的读音以及在其他语言中的翻译、对音。同时,网站兼收录其他少数民族的语言文字数据,如西夏文、契丹文、女真文、八思巴文。
网站地址:http://www.ccamc.co
来源:各语言文字数据库网站
编辑丨赵家铭
审核丨高源璞